Introducción a la confección de informes con Quarto

Taller introductorio a la Ciencia de Datos con R

Jan Strappa

Introducción a la confección de informes con Quarto

  • Introducción a Quarto
  • Aspectos básicos de YAML para la estructura del informe
  • Contenido: bloques de código, texto con formato, estilos
  • Renderización de informes en formato html, pdf y docx
  • Compartir y presentar reportes

Sobre R-Ladies Mendoza

R-Ladies Mendoza es parte de una organización mundial para promover la Diversidad de Género en la comunidad R.

¿Dónde pueden enterarse de nuestras actividades?

¿Qué es Quarto?

Sobre Quarto

Quarto (.qmd): es un sistema open source system para publicaciones… [AGREGAR qué permite crear, que es de Posit, etc, cortito]

Instalación de R, RStudio y Quarto

¿Qué herramientas usás actualmente para crear tus reportes?

TODO

MENTI

¿Por qué usar Quarto?

  • No necesitas saber de programación para usar Quarto
  • Los documentos están en texto plano: se puede usar cualquier editor
  • Software libre: comunidad, ayuda y tutoriales online, filosofía orientada a compartir conocimiento
  • Permite transparencia y reproducibilidad: ideal para investigadores
  • Mayor control sobre el contenido, más fácil de mantener: combina código, texto, referencias bibliográficas e imágenes en un solo lugar.
  • Muchas opciones de formatos y publicación online (gratuitas o pagas)

Un poco de historia y contexto

  • Markdown (.md): lenguaje de marcado de documentos (markup)
  • Quarto (.qmd): sistema open source para publicaciones (Markdown + código)
Un encabezado de primer nivel
=============================

Un encabezado de segundo nivel
------------------------------

Algunas palabras *tienen énfasis*.
Las palabras siguientes _también tienen énfasis_.

Usamos dos asteriscos para **mayor énfasis**.
O, si preferís, usá __dos guiones bajos__.

### Encabezado 3

> Esto es una cita.
>
> ## Esto es un encabezado dentro de una cita

Una lista

- un item
- otro item

Una lista ordenada

1. un paso
1. otro paso

Herramientas y formatos que usaremos

Nombre Extensión Uso
Quarto .qmd contenido
YAML .yml configuración
CSS .css estilo
HTML .html salida

Proceso

  1. El IDE crea la estructura del proyecto de publicación
  2. nos enfocamos en el contenido y estilo
  3. El IDE renderiza el proyecto
  4. repetimos pasos 2 y 3
  5. publicamos (para proyecto online)

TODO todo lo qu sigue

Librería eph

“La librería eph tiene por objecto facilitar el trabajo de aquellos usuarios y usuarias de la Encuesta Permanente de Hogares - INDEC que deseen procesar datos de la misma mediante el lenguaje de programación R”.

Tidyverse

Se trata de una colección de paquetes de R diseñados para facilitar y mejorar el proceso de manipulación, análisis y visualización de datos.

Instalación de Tidyverse

  • Ejecutar el siguiente código en la consola de R:
install.packages("tidyverse")
  • Al iniciar sesión en R (independientemente del IDE):
library(tidyverse)

Tidy data para un análisis eficiente

Una de las principales filosofías de Tidyverse es el enfoque de “tidy data”, que promueve la estructuración de los datos de manera ordenada y consistente para facilitar su análisis. También fomenta el uso de pipes (%>%)para encadenar operaciones de manipulación de datos de manera intuitiva.

Créditos a Pablo Tiscornia y Andrea Gómez Vargas

¿Cómo se estructura un proyecto?

Proyectos y rutas de trabajo

  • 📂 proyecto_eph_sociologia
    • 📂 docs_metodologicos
      • 📄 EPH_registro_1T2022.pdf
    • 📂 entradas
      • 📄 usu_hogar_T122.txt
      • 📄 usu_individual_T122.csv
    • 📂 salidas
      • 📄 grafico_barras.png
    • 📂 scripts
      • 📄 1_levantar_datos.R
    • 📄 proyecto_eph.Rproj

Proyectos y flujo de trabajo

  1. Creo y armo la carpeta del proyecto
  2. Ubico los datos en la carpeta correspondiente (entradas)
  3. Abro Rstudio y creo un proyecto, ubicado en la carpeta principal (por ejemplo, “proyecto_eph.Rproj”)
  4. Creo un script para trabajar en R y lo guardo en la carpeta script
  5. En el script, cargo los paquetes cuyas funciones voy a utilizar. Creo un objeto en el cual voy a importar los datos.

Carga de datos en el proyecto

# Cargo la librería
library(readr)

# Cargo los datos
dataset <- read_csv(readr_example("mtcars.csv"))

# Visualizo los datos
View(dataset)

# NOTA: para obtener más ayuda sobre los parámetros de la función, ejecutar en la consola "?read_csv"

Ejemplo de un proyecto

Ejemplo de un proyecto

Visita el repositorio con demostraciones para el taller en:

Los archivos que contienen los proyectos son:

  • 📄 taller_1.qmd
  • 📄 taller_2.qmd
  • 📄 taller_3.qmd

Comunidades colaborativas en la ciencia de datos

R para todes

R y los paquetes de CRAN son software libre. Al ser gratuitos los hacen accesibles para una amplia gama de usuaries y organizaciones. Entre otras cosas, el código fuente abierto permite a las personas ver, modificar y distribuir el software de acuerdo a sus necesidades puntuales. Esto fomenta la colaboración y la innovación en la comunidad.

¡Gracias por participar!

¿Dudas? ¿Consultas?

Enlaces útiles